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摘要 机 器 学 习 能 够 从 大 量 复杂 的 数 扫 
估 了 两 类 机 器 学 习 算法 在 人 1 
讨论 了 机 器 学 习 模 型 的 外 推 能 力 和 泛 化 能 力 。 
现 出 强大 的 能 力 。 将 机 器 学 习 方 法 应 
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Abstract 


章 参 数 ， 对 称 能 


结果 表明 :机 器 学 


的 关联 , 近 些 年 被 广泛 应 ) 
牙 正 核 质 量 、 重 构 重 离子 反应 碰撞 参数 以 及 提取 对 称 能 斜率 系数 等 热点 问题 上 的 表 
习 方 法 在 三 个 核 物理 问题 的 研究 中 均 体 
于 核 物理 问题 的 研究 中 可 以 进一步 探索 新 物理 ,从 而 更 好 地 推动 理论 


N 


在 科学 研究 中 。 本 文 分 别 记 


Studies on several problems in nuclear physics by using machine learning 
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[Background] Machine learning, which has been widely applied to scientific research in recent years, 


can be used to investigate the inherent correlations within a large number of complex data. [Purpose] We evaluate the 


performances of two types of machine-learning algorithms for correcting nuclear mass models, reconstructing the 


impact parameter in heavy-ion collisions, and extracting the symmetry energy slope parameter. We also discuss the 


extrapolation and generalization ability of the machine-learning models. [Method] For correcting the nuclear mass 


models, 10 characteristic quantities are fed into the LightGBM to mimic the residual between the experimental and 


the theoretical binding energies. For impact parameter or symmetry energy, two types of observables constructed 


based on the particle information simulated by using the UIQMD transport model for setting up the different impact 


parameters or symmetry energy slope parameters are used as inputs to a conventional neural network and the 


LightGBM to extract the original information. [Result] Analysis of these nuclear physics problems reveals the 


potential applicability of machine-learning methods. [Conclusions] Machine-learning methods can be used to 
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investigate new physical problems, thereby promoting the development of both theory and experiment. 


Key words 


机 器 学 习 是 人 工 智能 的 子 集 ,是 运用 不 同 算法 
从 数据 中 “自动 地 “智能 地 ”寻找 其 内 在 关联 并 进而 


得 到 某 种 规则 或 映射 ,然后 对 一 些 新 的 事件 作出 决 


定 或 预测 的 一 种 方法 。 与 传统 人 为 的 硬 编码 


AUR 


同 ,机 器 学 习 有 “自己 的 ”程序 模式 。 机 器 学 习 方 法 


通常 运用 一 定 的 数据 来 进行 “训练 ”, 这 些 数据 信息 


依次 反馈 到 模型 参数 中 ,实现 参数 的 扩展 或 更 新 。 
当下 ,机 器 学 习 已 在 众多 领域 的 研究 中 产生 了 许多 
有 价值 的 研究 成 果 。 作 为 一 种 新 的 研究 范式 ,机 器 
学 习 与 各 个 学 科 之 间 的 交叉 融合 必 将 深刻 影响 科学 


研究 的 进程 ”。 
原子 核 是 


个 量子 多 体系 统 , 其 相关 数据 的 维 


数 以 及 问题 的 复杂 程度 绝 不 亚 于 任何 一 个 其 他 领 
域 。 将 机 器 学 习 这 一 强大 的 工具 应 用 于 核 物理 问题 
的 研究 就 显得 尤为 重要 。 近 几 年 来 ,机 器 学 习 在 核 
物理 研究 中 的 工作 层出不穷 ,并 呈现 出 指数 形式 
的 增长 。 这 些 工作 多 数 利用 了 机 器 学 习 中 的 监督 学 
习 算 法 ,其 中 包含 多 种 机 器 学 习 模 型 。 这 些 模型 在 


研究 核 质量 、 中 子 皮 厚度 “电荷 半径 " OE XE 


Hg A Zu AR pr gon 、 BU zn [Ej ^5 


\ 核 数据 评估 5 


以 及 其 他 核 物 理 热点 问题 ”上 都 表现 出 强大 的 能 
力 。 本 文 对 两 类 机 器 学 习 算法 在 预测 原子 核 质 
量 ”、 重 构 核 反应 碰撞 参数 “下 以 及 提取 对 称 能 斜 


率 系 数 *" 间 题 放 在 一 起 进行 分 析 探 讨 。 
1 理论 框架 


本 文 应 用 极端 相对 论 量 子 分 子 动力 学 模型 


(Ultrarelativistic Quantum 


Molecular Dynamics; 


UrQMDO P f UL E Es T ftdt Sf. UrQMD 模型 


EB 


要 包括 初始 化 ` 势 修正 、 核 子 -核子 磁 撞 以 及 末 态 碎 


片 构建 等 部 分 。 


现 版 本 通过 在 势 修正 部 分 引入 


Skyrme 能 量 密度 泛 函 , 以 及 在 碰撞 项 部 分 考虑 散射 
截面 介质 修正 、 泡 利 阻 塞 等 ,已 被 广泛 应 用 于 研究 多 


^F REPE HOHER T REO n 


初始 化 是 核反应 模拟 的 基础 和 前 提 , 因此， 


要 首先 构建 好 一 个 更 加 合理 的 初始 化 。 原 子 核 质量 


是 初始 化 过 程 中 基本 输入 量 。 利 用 机 器 学 习 算 法 对 


当前 比较 流行 的 几 种 原子 核 质量 模型 进行 了 修了 


IE; 


其 预测 以 及 外 推 能 力 将 在 下 文中 展示 。 同 时 ,很 多 


研究 表明 , 弹 、 施 核 中 一 些 特殊 的 初始 结构 ,譬如 形 
变 、 中 子 皮 以 及 团 簇 现象 等 也 会 在 一 定 程度 上 影响 


核反应 过 程 及 结果 。 文 献 [33] 中 有 具体 探讨 了 弹 靶 核 
四 极 形变 对 未 态 观 测量 的 影响 ,并且 结合 机 器 学 习 


080009-2 


Machine learning, Nuclear mass, Impact parameter, Symmetry energy 


方法 识别 出 四 极 形变 的 信号 。 


入 量 , 它 


此 外 ,碰撞 参数 同样 是 初始 化 过 程 中 重要 的 输 
直接 影响 核反应 过 程 中 弹 靶 核 重 且 区 域 的 


大 小 和 形状 ,因而 对 反应 末 态 的 大 部 分 观测 量 有 很 


影响 。 然 而 ,实验 上 不 能 直接 确定 每 次 反应 事件 
E, 因 而 带 


的 碰撞 参数 ,只 能 通过 末 态 观测 量 进行 反 


有 一 定 的 不 确定 性 。 因 此 ,提出 了 一 种 利用 机 器 学 
习 算 法 重 构 核 反应 初 态 碰撞 参数 的 方法 。 在 这 个 过 


程 中 , 利 


] UrQMD 模拟 不 同 碰撞 参数 下 的 核 -核磁 
E, 入选 末 态 粒子 信息 构造 一 些 特定 的 物理 量 作为 


机 器 学 习 的 特征 量 , 通 过 学 习 这 些 特征 量 与 碰撞 参 


数 之 间 的 关联 来 重 构 碰 撞 参 数 。 
对 于 势 修正 部 分 ,两 体 相 互 作 


133 86 U H 


Skyrme 能 量 密度 泛 函 给 出 的 密度 依赖 部 分 、 库 仑 
项 动量 相关 项 、 表 面 能 项 、 表 面 不 对 称 项 以 及 对 称 


能 项 等 


< 同 描述 。 通 过 改变 势能 参数 ,可 以 得 到 不 


同 的 核 物质 不 可 压缩 系数 K, 以 及 饱和 密度 处 的 对 


称 能 斜率 系数 L(p,)。 
“人 硬 ”"CHM)、“ 软 ”SM) 的 状态 方程 。 在 文献 [34 站 | 


mj 


其 中 ,本 的 数值 大 、 小 对 应 


, 


利用 机 器 学 习 方法 有 效 地 识别 了 单 次 碰撞 事件 中 的 


状态 方程 的 “ 软 硬 ”。 当 下 ,人 们 对 & 的 认识 相对 清 


晰 。 然 而 ,对 尤其 在 高 密度 区 的 对 称 能 密度 依赖 形 


式 的 研究 中 则 出 现 了 很 大 分 歧 。 


图 1 展示 了 6 组 不 


同 的 参数 设置 下 的 对 称 能 密度 依赖 形式 ,其 范围 覆 
六 了 当前 ZL 的 最 大 不 确定 度 。 本 文 将 UrQMD 在 不 
同 对 称 能 参数 设置 下 生成 的 粒子 数据 用 作 数 据 集 ， 
利用 机 器 学 习 算 法 分 类 对 称 能 的 密度 依赖 形式 ,并 


从 单 事件 中 直接 提取 LCp,)。 


对 于 碰撞 项 部 分 ,模型 引入 了 介质 修正 以 及 泡 


B nar f fod 
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1 对 称 能 (a) 以 及 对 称 能 斜率 (b) 随 密度 的 变化 
Fig.1 The nuclear symmetry energy (a) and its slope 
parameter (b) plotted as a function of density 
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利 阻塞 效应 等 。 对 于 核子 -核子 弹性 散射 截面 ,采用 
密度 、 相 对 动量 及 同位 旋 不 对 称 度 三 者 均 相 关 的 参 
数 化 因子 Fpw,0) 进 行 修正 。 然 而 ,实际 上 ,对 于 
不 同 大 小 的 碰撞 体系 和 不 同 的 入 射 能 量 ,F 因 子 不 

能 被 完整 ,细致 描述 。 因 此 ,也 可 以 将 FY,pws0) 的 
平均 证 应 简 8 单 依赖 于 入 射 能 量 并 寻找 (BE,,) 的 上 县 体 
形式 。 最 近 , 也 在 探索 机 器 学 习 方法 在 确定 P(E,) 
上 的 可 行 性 。 在 本 文 的 工作 中 ,将 截面 介质 修正 视 
作 模 型 参数 ， 通过 设置 介质 中 有 修正 (In medium, D 
以 及 自由 空间 无 修正 (Free space,F) 两 种 参数 来 评 
估 机 器 学 习 的 泛 化 能 力 , 即 机 器 学 习 是 否 可 以 通过 
训练 不 同 的 参数 设置 下 生成 的 数据 来 找 出 相似 的 规 


p^ 


律 并 进行 判断 ,以 尽量 避免 对 模型 的 依赖 性 。 
2 ”机 器 学 习 算法 


本 文 主要 使 用 两 种 机 器 学 习 算法 ,分 别 是 卷 积 
神经 网 络 (Convolutional Neural Network,CNN) 和 一 
种 基于 决策 树 算法 的 轻 量 梯 度 提 升 机 (Light 
Gradient Boosting Machine, LightGBM) 。 

神经 网 络 (Neural Network,NN) 算 法 是 目前 主 
流 的 机 器 学 习 算 法 ,然而 ,传统 的 神经 网 络 存在 着 对 
特殊 任务 的 针对 性 较 弱 .收敛 速度 慢 、 容 易 丢 失 多 维 
数据 的 空间 关联 等 不 足 之 处 。CNN 在 NN 的 基础 上 
添加 了 卷 积 层 和 池 化 层 以 实现 提取 主要 特征 的 作 
用 。 因 此 ,CNN 能够 有 效 地 识别 数据 之 间 的 空间 关 
联 , 并 通过 共享 权重 的 方式 避免 参数 过 度 膨 胀 。 文 
中 主要 采用 2D-CNN 算法 ,并 选择 末 态 核子 的 横 动 
量 (p,) 与 快 度 Gy,) 的 分 布 作为 训练 过 程 的 特征 量 , 标 
签 为 碰撞 参数 或 对 称 能 参数 。 为 了 优化 训练 的 结 
果 , 解 决 在 训练 过 程 中 出 现 的 梯度 弥散 、 数 据 分 布 不 
均衡 .过 拟 合 和 欠 拟 合 等 问题 ,在 层 与 层 之 间 还 充分 
考虑 了 批 归 一 化 (Batch Normalization)、 随 机 失 活 
(Dropout) 激活 函数 (Activation Function) 以 及 正则 
化 (Regularize) 等 过 程 。 

LightGBM 是 一 种 基于 直方 图 思想 的 决策 树 算 
法 , 它 对 传统 的 GBDT (Gradient Boosting Decision 
Tree) 算 法 进行 了 一 系列 的 改进 “梯度 提升 ”表示 模 

型 每 次 迭代 时 预测 的 目标 为 前 一 次 的 迭代 结果 与 最 
终 目 标 之 间 的 偏差 。 区 别 于 其 他 决策 树 算法 ,模型 
采用 单 边 梯度 采样 、 最 大 深度 限制 以 及 互 斥 特征 捆 
绑 等 方法 。 这 是 LightGBM 特有 的 在 减少 采样 数据 
量 和 保证 预测 精度 上 平衡 的 算法 。LightGBM 适用 
于 任何 类 型 的 特征 量 ,并 有 具备 运行 速度 快 、 可 解释 性 
强 等 特点 。 


3 ”结果 和 讨论 


3.1 ”原子 核 质 量 模型 的 修正 


首先 讨论 对 原子 核 质 量 的 预测 结果 。 


使 用 


LightGBM 预测 质量 模型 (包括 LDM、DZ、WS4、 
FRDM) 的 理论 值 与 实验 值 的 偏差 6(Z,4) 来 修正 这 


些 模 型 。 选 
为 特征 量 。 


] 10 个 与 原子 核 质 量 相关 的 物理 量 作 
随机 选择 AME201655 中 80% 的 原子 核 


的 数据 作为 训练 集 ,模型 在 剩余 20% 测 试 集 上 的 预 
测 值 与 实验 值 的 均 方 根 偏 差 (Root Mean Square 
Deviation; RMSD) 4) 3i] X 0.234 MeV、0.213 MeV. 
0.170 MeV.0.222 MeV, 相 比 于 修正 前 的 质量 模型 ， 


其 RMSD 值 分 别 降低 了 约 90%、65%、 


40% 和 60%。 


相 比 于 内 插 的 预测 ,质量 模型 的 外 推 能 力 是 更 


~ 


新 增 了 66 个 原子 核 的 质 
到 了 修正 后 的 质量 模型 


直 得 关心 的 。 在 AME2016 的 基础 上 ,AME202059 


质量 数据 。 训 练 AME2016 得 
,并 对 新 增 的 66 个 原子 核 的 


质量 进行 了 预测 ,其 结果 展示 在 图 2 中 ,其 中 :空心 


莪 形 为 4 种 质量 模型 的 结果 , 实 
正 后 的 4 种 质量 模型 的 结果 ;ou 和 as 
表示 原始 模型 以 及 LightGBM 修正 后 的 理论 


LightGBM 修 


心 正 方形 为 


值 与 实 


验 值 之 间 的 RMSD。 可 以 看 出 ,无 论 是 原始 模型 ,还 


是 修正 后 的 模型 ,其 RMSD 都 


不 同 程度 的 增加 。 


这 表明 ,质量 模型 在 外 推 时 ,尤其 是 对 于 远离 训练 样 


本 的 对 象 ,其 性 


EI RT Ae PESE DIC 
修正 前 后 的 RMSD ,不 可 否 


但 通过 比较 
3 认 的 是 机 器 学 习 方 法 在 


这 样 大 范围 的 外 推 任务 中 依然 表现 出 强大 的 修正 
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图 2  AME2020 中 新 测量 


90 100 20 30 40 50 60 70 80 90100110 
Z 


的 66 个 核 素 的 结合 能 的 理论 值 与 


实验 值 的 偏差 
Fig.2 The results of 66 newly measured nuclei appeared in 
the AME2020 mass evaluation 


32 ”碰撞 参数 的 重 构 


接 下 来 讨论 对 重 构 重 离子 反应 碰撞 参数 的 结 
果 。 利 用 UrQMD F W T A H fE Æ 5,=0.2~ 
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1.0 GeV * nucleon :的 Au+Au 反 应 ,全 撞 参 数 范围 为 
0~10 fm。 将 反应 末 态 质子 的 p-y, 谱 分 布 划 分 为 nx 
7 个 格子 ,计数 落 入 每 个 格子 的 质子 数 作 为 训练 过 
程 的 特征 量 。 分 别 选 用 CNN 与 LightGBM 重 构 碰撞 
参数 bp。 以 碰撞 参数 的 预测 值 和 真实 值 的 平均 绝对 
误差 和 Ab 作为 重 构 性 能 的 评估 标准 。 文 献 [27] 分 别 
探究 了 Ab 对 机 器 学 习 模 型 .入 射 能 量 、 训 练 集 容量 、 
划分 的 格子 数 n 以 及 UrQMD 模型 参数 设置 的 依 
赖 性 。 

这 里 主要 讨论 划分 的 格子 数 n 的 影响 以 及 机 器 
学 习 模 型 的 对 比 。 如 图 3 所 示 , 三 种 机 器 学 习 算 法 
在 描述 Ab 随 n 的 变化 表现 出 类 似 的 行为 , 均 是 先 减 
小 后 趋 于 平缓 ,其 中 :NN 的 结果 取 自 文献 L37]。 这 
是 由 于 过 少 的 格子 数 会 丢失 不 同 碰撞 参数 下 质子 分 
布 细节 的 信息 ,过 多 的 格子 数 会 导致 涨 落 信号 的 增 
强 淹没 差异 ,并 大 幅度 降低 模型 的 训练 速度 。 然 而 ， 
不 同 算法 的 收敛 位 置 不 同 。 有 趣 的 是 ,NN 与 CNN 
> 间 的 曲线 存在 交叉 ,意味 着 机 器 学 习 算 法 对 数据 
类 型 的 适用 性 和 敏感 程度 不 同 。 这 也 驱使 测试 更 多 
的 机 器 学 习 算 法 ,寻找 更 丰富 的 特征 量 组 合 以 及 更 
多 元 的 数据 集 类 型 。 


Au+Au, E,,—1.0 GeV-nucleon !, 0:5: 10 fm 
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图 3 Ab 对 格子 数 n 的 依赖 

Fig.3 Ab dependence of the input grid dimension n 

为 了 起 到 指导 实验 的 目的 ,进一步 对 SrRIT 实 
验 体系 下 的 碰撞 参数 重 构 做 了 系统 性 研究 。 具 体 为 
A ITRE Æ E,,—0.27 GeV + nucleon” HY "Sn-""Sn 的 反 
MIRR, tdt RC EA 0—7 fm。 考 虑 到 输 运 模型 
对 核反应 过 程 的 描述 与 真实 情况 存在 一 定 的 差异 ， 
有 必要 评估 机 器 学 习 模 型 的 泛 化 能 力 。 因 此 ,文献 
[26] 选用 “ 软 ”“ 硬 ”状态 方程 以 及 有 无 截面 介质 修正 
交叉 组 合 下 的 参数 设置 模拟 生成 4 组 数据 集 。 选 用 
三 种 机 器 学 习 方 法 (CANN、CNN 和 LightGBM) 以 及 
两 类 特征 量 分 别 训 练 。 其 中 ,一 类 特征 量 为 文献 
[27] 提 及 的 粒子 谱 分 布 (DATASET1) ,但 改 用 所 有 
带电 粒子 的 信息 ;第 二 类 特征 量 为 末 态 粒子 信息 构 


建 的 7 个 可 观测 量 (DATASET2) ,包括 电荷 多 重 数 
(M,), 轻 粒子 的 横向 动能 (5,) 等 。 这 些 观测 量 对 磁 
撞 参 数 有 较 强 的 依赖 。 

对 碰撞 参数 的 重 构 准 确 度 如 图 4 所 示 。 其 中 ， 
对 角 线 上 的 训练 数据 与 测试 数据 来 自 同 一 个 模型 参 
数 , 非 对 角 线 为 不 同 模型 参数 间 交 叉 测 试 的 结果 , 反 
对 角 线 为 模型 参数 差异 最 大 的 结果 。 总 体 来 说 ,在 
所 有 的 模型 选取 、 参 数 设置 以 及 特征 量 类 型 下 的 重 
构 碰 撞 参 数 的 Ab 在 0.3~0.8 fm 之 间 。 可 以 看 出 ,所 
有 子 图 中 对 角 线 的 数值 都 是 所 在 行 与 所 在 列 中 最 小 
的 。 这 表明 ,机 器 学 习 在 自身 参数 设置 下 进行 预测 
可 以 得 到 最 好 的 结果 ,而 交叉 验证 则 在 一 定 程度 上 
都 会 损失 部 分 精度 。 有 具体 来 说 ,散射 截面 与 状态 方 
程 影响 了 机 器 学 习 重 构 碰 撞 参 数 的 准确 度 。 此 外 ， 
通过 分 析 每 一 行 的 数值 可 以 发 现 ,散射 截面 修正 对 
碰撞 参数 的 影响 要 大 于 状态 方程 软 硬 的 影响 ,这 是 
由 于 相 比 起 状态 方程 ,散射 截面 会 直接 影响 反应 过 
程 中 粒子 的 碰撞 数 、 进 而 影响 初始 信息 的 传递 。 
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El4 每 个 格子 中 的 数值 表示 通过 学 习 训练 集 (使 用 水 平 标 
记 的 模型 生成 的 ) 得 到 的 模型 在 测试 集 (使 用 竖 直 标记 的 模 
型 生成 的 ) 的 预测 值 的 , 左 侧 和 右 侧 图 分 别 采 用 第 一 和 第 二 
类 特征 量 
Fig.4 Number in each cell denotes Ap for the testing data 
(generated with the vertical labeled mode) by using the training 
data (generated with the horizontal labeled mode). The left 
panels (right panels) present the results of the first (second) 
type of characteristic quantity. 
在 最 近 的 研究 中 发 现 ,如 果 预 先 对 特征 量 进行 
标准 化 ,模型 的 泛 化 能 力 会 大 幅 提 升 。 甚 至 训练 好 
的 模型 对 “自身 ”测试 集 的 预测 结果 要 弱 于 “ 泛 化 ” 测 
试 集 的 结果 。 这 可 以 通过 对 小 参数 区 间 内 不 同 参 
数 设置 下 观测 量 的 涨 落 大 小 分 析 来 解释 。 
3.3 ”对 称 能 参数 的 提取 


最 后 讨论 对 称 能 参数 的 分 类 以 及 对 提取 LCp) 
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的 结果 。 前 者 中 采用 CNN 识别 末 态 质子 谱 或 中 子 
谱 分 布 与 对 称 能 参数 之 间 的 关联 。 这 里 ,利用 
UrQMD 分 别 模拟 5 种 对 称 能 参数 设置 下 的 入 射 能 
量 为 已 ,=0.4 GeV * nucleon” , fil f& Z: 273 b=5 fm 的 
Au-Au 碰撞 得 到 训练 过 程 的 数据 集 。 首 先 , 评 估 了 
不 同 对 称 能 参数 设置 下 的 单 事件 以 及 100 个 事件 县 
加 的 粒子 谱 分 布 。 对 于 单 事 件 来 说 ,初始 化 过 程 中 
粒子 的 相 空间 位 置 是 在 一 定 约束 范围 内 随机 抽取 
的 。 同 时 ,核子 -核子 散射 会 进一步 扩大 不 确定 性 ， 
这 就 导致 对 称 能 的 信号 在 核反应 过 程 中 被 不 断 地 涯 
没 。 多 事件 县 加 能 够 有 效 地 消除 部 分 涨 落 信号 ,给 
出 类 似 统计 的 结果 。 然 而 ,尽管 选用 100 个 事件 县 
加 ,也 很 难 从 谱 中 发 现 对 称 能 的 效应 。 

利用 机 器 学 习 方 法 ,首先 ,评估 了 二 分 类 的 结 
果 。CNN 在 二 分 类 中 分 别 得 到 了 98% (SKI vs. 
Skz4) 和 63%(SkI2 vs. SV-sym34) 的 准确 率 , 对 应 对 
称 能 差异 最 大 和 最 小 的 两 种 情况 ,其 他 二 分 类 结果 
均 在 它们 中 间 。 此 外 ,发 现 二 分 类 的 准确 率 与 两 种 
对 称 能 的 差 值 存在 较 强 的 线性 关联 。 这 表明 CNN 
能 够 从 末 态 质子 谱 分 布 上 捕捉 对 称 能 的 密度 依赖 
BE. 

对 于 五 分 类 任务 ,选用 又 加 事件 作为 数据 集 。 
利用 质子 谱 分 布 CNN 可 以 得 到 58% 的 准确 率 , 相 当 
于 随机 猜测 的 三 倍 , 而 训练 中 子 谱 分 布 则 可 以 得 到 
72% 的 准确 率 。 混 淆 矩阵 是 显示 多 个 分 类 模型 预测 
性 能 的 一 种 好 方法 。 图 $ 显 示 了 五 分 类 任务 的 混淆 
抢 阵 ,其 中 :每 个 非 对 角 元 中 的 数值 表示 对 称 能 ( 垂 
直 标 记 ) 的 对 象 被 错误 分 类 为 水 平 标记 对 称 能 的 概 
率 ; 对 角 圆 表示 正确 分 类 该 对 称 能 的 概率 ;图 $Ca) 和 
Cb) 分 别 为 选用 质子 事件 县 加 与 中 子 事件 县 加 作为 
特征 量 的 结果 。 对 角 线 数值 表示 水 平 标记 对 称 能 被 
正确 分 类 的 概率 ,可 以 看 出 ,它们 是 每 行 中 最 大 的 。 
在 质子 分 布 的 结果 中 ,78% 的 SkI1 样 本 可 以 被 正确 
识别 ,而 其 中 20% 被 错误 识别 为 SkI2 ,其 余 2% 被 错 
误 识 别 成 SV-sym34。 此 外 ,SLy230a 和 SV-sym34 对 
称 能 接近 ,因此 ,将 它们 之 间 错 误 识 别 彼此 的 概率 


很 高 。 
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5 五 类 分 类 任务 的 混淆 矩阵 


Fig.5 Confusion matrix for the five-class classification task 


Protons, Predicted Labels 


以 上 的 结果 表明 ,机 器 学 习 在 提取 对 称 能 参数 
的 任务 中 具有 一 定 的 可 行 性 。 接 下 来 ,进一步 利用 
LightGBM 直接 提取 和 斜率 系数 LCpo) 的 数值 。 区 别 于 
上 文 所 述 ,在 这 个 任务 中 选取 单 事件 反应 末 态 质子 、 
氛 核 分 别 在 中 心 快 度 、 弹 靶 快 度 区 域 的 共计 30 个 可 
观测 量 作 为 训练 过 程 的 特征 量 。 标 签 为 6 种 对 称 能 
参数 对 应 的 L(p,)。 选 取 4 种 UrQMD 参数 设置 生成 
数据 集 来 评估 模型 的 泛 化 能 力 , 这 些 参数 分 别 考 虑 
了 状态 方程 的 “ 软 硬 和 核子 -核子 散射 截面 以 及 末 态 
碎片 构建 的 相 空 间 约束 方式 。 结 果 表 明 ,LightGBM 
对 4 种 参数 设置 下 的 预测 值 与 真实 值 的 平均 绝对 误 
Æ (Mean Absolute Error,MAE) 均 小 于 30 MeV。 然 
而 ,如 果 仅 选择 4 个 特征 量 进行 预测 ,LightGBM 给 
出 的 结果 如 图 6(a) 所 示 。 可 以 看 出 ,曲线 是 对 分 布 
的 高 斯 拟 合 ,模型 对 6 种 参数 设置 下 的 数据 集 给 出 
的 预测 结果 几乎 重 县 ,无 法 仅 从 几 个 观测 量 在 单 事 
件 中 提取 对 称 能 系数 。 然 而 , 若 将 特征 量 增加 为 30 
个 ,预测 值 分 布 明 显 分 离 ,并且 更 接近 于 真实 值 。 这 
些 结果 同时 也 表明 ,由 于 反应 初 态 及 输 运 过 程 都 存 
在 一 定 的 涨 落 , 仅 通过 独立 特征 量 很 难 给 出 有 效 信 
息 。 但 机 器 学 习 方 法 可 以 通过 训练 多 个 特征 量 , 寻 
找 它们 之 间 的 深层 、 多 维 的 关联 ,从 而 给 出 更 为 准确 
的 判断 。 这 正 是 机 器 学 习 方 法 的 优势 所 在 ,对 于 传 
统 分 析 方 法 来 说 则 是 很 难 做 到 的 。 
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6 对称 能 斜率 参数 L(p,) 预 测 值 的 分 布 
(a, b) 分 别 为 4 个 和 30 个 观测 量 的 结果 
Fig.6 Distributions of the predicted symmetry energy slope 
parameter L(p,) 
(a, b) The results obtained with 4 and 30 observables, 
respectively 
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士 、 
结语 


本 文 将 CNN 与 LightGBM 分 别 应 用 于 原子 核 质 


量 模型 的 修正 、 磁 撞 参 数 的 重 构 以 及 对 称 能 参数 的 


提取 三 个 核 物 


时 问题 ,得 到 以 下 结果 :1) 优 化 了 原子 


核 质 量 公 式 , 使 均 方 根 偏差 小 于 0.2 MeV. fE PM 
任务 中 依然 给 出 很 好 的 修正 ;2) 对 于 


TY 


1 GeV nucleon"' 的 AutAu 人 页 撞 , 利 用 质子 的 p.-y, 谱 
分 布 , 重 构 磁 撞 参 数 的 Ab 小 于 0.1 fm;3) 对 于 
0.27 GeV * nucleon” 的 Sn+Sn 碰撞, 利用 两 种 类 型 特 


征 量 ,Ab 在 0.3~0.4 fm 之 内 ;4) 对 5 种 对 称 能 的 分 


类 ,到 加 事件 质子 和 中 子 谱 的 分 类 结果 分 别 为 58% 
与 72%;5) 对 于 对 称 能 斜率 系数 的 预测 ,使 用 30 个 


TER 


in| 


E 量 得 到 的 Zou 预测 值 和 真实 值 之 间 的 平均 绝 


对 误差 小 于 30 MeV. 


机 器 学 习 方法 在 上 述 核 物理 问题 上 为 提供 了 一 


种 新 的 研究 方案 。 此 外 ,机 器 学 习 方法 可 以 更 广泛 
地 利用 于 分 析 庞 大 的 核 数据 、 大 能 量 范围 的 重 离子 
反应 实验 数据 等 站。 同时 ,机 器 学 习 的 可 解释 性 
研究 能 力也 为 理论 核 物理 的 发 展 提供 有 价值 的 帮 


助 。 


更 进一步 地 ,在 机 器 学 习 的 基础 上 加 入 物理 约 


束 ,使 人 工 智能 更 “ 慌 ” 物 理 问题 ,进而 为 理论 和 实验 
研究 提供 更 强 有 力 的 技术 支撑 。 
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